Z Lab 发布开源推测解码框架 DFlash

Z Lab 宣布开源推想解码框架 DFlash

Z Lab 发布了开源推测解码框架 DFlash,这是一种利用轻量级 Block Diffusion 模型进行草稿生成的推测解码方法。该方法旨在解决自回归大语言模型在推测解码中因串行草稿生成导致的效率瓶颈。 DFlash 通过融合目标模...